
<!-- saved from url=(0065)http://www.gelbukh.com/CV/Publications/1999/CIC-1999-Anaphora.htm -->
<HTML><HEAD><META http-equiv="Content-Type" content="text/html; charset=windows-1252">

<TITLE>LA Resoluci&oacute;n de correferencia con un diccionario de escenarios</TITLE>
<STYLE>
<!--
 
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {
        margin-top:8.0pt;
        margin-right:0cm;
        margin-bottom:0cm;
        margin-left:0cm;
        margin-bottom:.0001pt;
        text-align:justify;
        text-indent:21.25pt;
        line-height:110%;
        layout-grid-mode:char;
        font-size:12.0pt;
        font-family:"Times New Roman";}
h1
        {margin-top:18.0pt;
        margin-right:0cm;
        margin-bottom:6.0pt;
        margin-left:21.6pt;
        text-align:center;
        text-indent:-21.6pt;
        line-height:110%;
        layout-grid-mode:char;
        font-size:12.0pt;
        font-family:"Times New Roman";
        text-transform:uppercase;}
h2
        {margin-top:18.0pt;
        margin-right:0cm;
        margin-bottom:6.0pt;
        margin-left:17.85pt;
        text-indent:-17.85pt;
        line-height:110%;
        page-break-after:avoid;
        font-size:14.0pt;
        font-family:"Times New Roman";}
h3
        {margin-top:9.0pt;
        margin-right:0cm;
        margin-bottom:3.0pt;
        margin-left:36.0pt;
        text-align:justify;
        text-indent:-36.0pt;
        line-height:110%;
        layout-grid-mode:char;
        font-size:12.0pt;
        font-family:"Times New Roman";
        font-style:italic;}
h4
        {
        margin-top:9.0pt;
        margin-right:0cm;
        margin-bottom:3.0pt;
        margin-left:43.2pt;
        text-align:justify;
        text-indent:-43.2pt;
        line-height:110%;
        layout-grid-mode:char;
        font-size:12.0pt;
        font-family:"Times New Roman";
        font-weight:normal;
        font-style:italic;}
h5
        {
        margin-top:12.0pt;
        margin-right:0cm;
        margin-bottom:3.0pt;
        margin-left:50.4pt;
        text-align:justify;
        text-indent:-50.4pt;
        line-height:110%;
        layout-grid-mode:char;
        font-size:11.0pt;
        font-family:"Times New Roman";
        font-weight:normal;}
h6
        {
        margin-top:12.0pt;
        margin-right:0cm;
        margin-bottom:3.0pt;
        margin-left:57.6pt;
        text-align:justify;
        text-indent:-57.6pt;
        line-height:110%;
        layout-grid-mode:char;
        font-size:11.0pt;
        font-family:"Times New Roman";
        font-weight:normal;
        font-style:italic;}
p.MsoHeading7, li.MsoHeading7, div.MsoHeading7
        {
        margin-top:12.0pt;
        margin-right:0cm;
        margin-bottom:3.0pt;
        margin-left:64.8pt;
        text-align:justify;
        text-indent:-64.8pt;
        line-height:110%;
        layout-grid-mode:char;
        font-size:12.0pt;
        font-family:Arial;}
p.MsoHeading8, li.MsoHeading8, div.MsoHeading8
        {
        margin-top:12.0pt;
        margin-right:0cm;
        margin-bottom:3.0pt;
        margin-left:72.0pt;
        text-align:justify;
        text-indent:-72.0pt;
        line-height:110%;
        layout-grid-mode:char;
        font-size:12.0pt;
        font-family:Arial;
        font-style:italic;}
p.MsoHeading9, li.MsoHeading9, div.MsoHeading9
        {
        margin-top:12.0pt;
        margin-right:0cm;
        margin-bottom:3.0pt;
        margin-left:79.2pt;
        text-align:justify;
        text-indent:-79.2pt;
        line-height:110%;
        layout-grid-mode:char;
        font-size:9.0pt;
        font-family:Arial;
        font-weight:bold;
        font-style:italic;}
p.MsoFootnoteText, li.MsoFootnoteText, div.MsoFootnoteText
        {margin-top:8.0pt;
        margin-right:0cm;
        margin-bottom:0cm;
        margin-left:42.55pt;
        margin-bottom:.0001pt;
        text-align:justify;
        text-indent:-7.1pt;
        line-height:110%;
        layout-grid-mode:char;
        font-size:8.0pt;
        font-family:"Times New Roman";}
p.MsoHeader, li.MsoHeader, div.MsoHeader
        {margin-top:8.0pt;
        margin-right:-1.45pt;
        margin-bottom:0cm;
        margin-left:0cm;
        margin-bottom:.0001pt;
        text-align:center;
        line-height:110%;
        layout-grid-mode:char;
        font-size:8.0pt;
        font-family:"Times New Roman";
        font-variant:small-caps;}
p.MsoFooter, li.MsoFooter, div.MsoFooter
        {margin-top:8.0pt;
        margin-right:0cm;
        margin-bottom:0cm;
        margin-left:0cm;
        margin-bottom:.0001pt;
        text-align:justify;
        text-indent:21.25pt;
        line-height:110%;
        layout-grid-mode:char;
        font-size:8.0pt;
        font-family:"Times New Roman";}
p.MsoCaption, li.MsoCaption, div.MsoCaption
        {
        margin-top:8.0pt;
        margin-right:0cm;
        margin-bottom:6.0pt;
        margin-left:0cm;
        text-align:justify;
        text-indent:21.25pt;
        line-height:110%;
        layout-grid-mode:char;
        font-size:12.0pt;
        font-family:"Times New Roman";
        font-weight:bold;}
span.MsoFootnoteReference
        {vertical-align:super;}
p.MsoEndnoteText, li.MsoEndnoteText, div.MsoEndnoteText
        {margin-top:8.0pt;
        margin-right:0cm;
        margin-bottom:0cm;
        margin-left:0cm;
        margin-bottom:.0001pt;
        text-align:justify;
        text-indent:21.25pt;
        line-height:110%;
        layout-grid-mode:char;
        font-size:12.0pt;
        font-family:"Times New Roman";}
p.MsoList, li.MsoList, div.MsoList
        {margin-top:8.0pt;
        margin-right:0cm;
        margin-bottom:0cm;
        margin-left:21.25pt;
        margin-bottom:.0001pt;
        text-align:justify;
        text-indent:-21.25pt;
        line-height:110%;
        layout-grid-mode:char;
        font-size:12.0pt;
        font-family:"Times New Roman";}
a:link, span.MsoHyperlink
        {color:blue;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {color:purple;
        text-decoration:underline;}
p.Coordonnes, li.Coordonnes, div.Coordonnes
        {
        margin-top:8.0pt;
        margin-right:0cm;
        margin-bottom:0cm;
        margin-left:0cm;
        margin-bottom:.0001pt;
        text-align:center;
        text-indent:14.0pt;
        line-height:110%;
        layout-grid-mode:char;
        font-size:12.0pt;
        font-family:"Times New Roman";}
p.Reference, li.Reference, div.Reference
        {
        margin-top:8.0pt;
        margin-right:0cm;
        margin-bottom:0cm;
        margin-left:14.2pt;
        margin-bottom:.0001pt;
        text-align:justify;
        text-indent:-14.2pt;
        line-height:110%;
        layout-grid-mode:char;
        font-size:12.0pt;
        font-family:"Times New Roman";}
p.Abstract, li.Abstract, div.Abstract
        {
        margin-top:8.0pt;
        margin-right:19.85pt;
        margin-bottom:0cm;
        margin-left:21.25pt;
        margin-bottom:.0001pt;
        text-align:justify;
        text-indent:21.25pt;
        line-height:110%;
        layout-grid-mode:char;
        font-size:8.0pt;
        font-family:"Times New Roman";}
p.Authors, li.Authors, div.Authors
        {
        margin-top:6.0pt;
        margin-right:0cm;
        margin-bottom:6.0pt;
        margin-left:0cm;
        text-align:center;
        line-height:110%;
        layout-grid-mode:char;
        font-size:12.0pt;
        font-family:"Times New Roman";
        font-variant:small-caps;}
p.Address, li.Address, div.Address
        {
        margin-top:8.0pt;
        margin-right:0cm;
        margin-bottom:0cm;
        margin-left:0cm;
        margin-bottom:.0001pt;
        text-align:center;
        line-height:110%;
        layout-grid-mode:char;
        font-size:8.0pt;
        font-family:"Times New Roman";
        font-style:italic;}
p.Abstract1, li.Abstract1, div.Abstract1
        {
        margin-top:18.0pt;
        margin-right:19.85pt;
        margin-bottom:0cm;
        margin-left:21.25pt;
        margin-bottom:.0001pt;
        text-align:justify;
        text-indent:21.25pt;
        line-height:110%;
        layout-grid-mode:char;
        font-size:8.0pt;
        font-family:"Times New Roman";}
p.Abstract2, li.Abstract2, div.Abstract2
        {
        margin-top:8.0pt;
        margin-right:19.85pt;
        margin-bottom:0cm;
        margin-left:21.25pt;
        margin-bottom:.0001pt;
        text-align:justify;
        text-indent:21.25pt;
        line-height:110%;
        layout-grid-mode:char;
        font-size:8.0pt;
        font-family:"Times New Roman";}
p.Ttulo2sinnumero, li.Ttulo2sinnumero, div.Ttulo2sinnumero
        {
        margin-top:18.0pt;
        margin-right:0cm;
        margin-bottom:6.0pt;
        margin-left:0cm;
        line-height:110%;
        page-break-after:avoid;
        font-size:14.0pt;
        font-family:"Times New Roman";
        font-weight:bold;}
p.Figure, li.Figure, div.Figure
        {
        margin-top:8.0pt;
        margin-right:0cm;
        margin-bottom:0cm;
        margin-left:0cm;
        margin-bottom:.0001pt;
        text-align:center;
        text-indent:21.25pt;
        line-height:110%;
        layout-grid-mode:char;
        font-size:12.0pt;
        font-family:"Times New Roman";
        font-weight:bold;}
p.RefName, li.RefName, div.RefName
        {
        margin-top:8.0pt;
        margin-right:0cm;
        margin-bottom:0cm;
        margin-left:13.5pt;
        margin-bottom:.0001pt;
        text-align:justify;
        text-indent:-13.5pt;
        line-height:110%;
        layout-grid-mode:char;
        font-size:12.0pt;
        font-family:"Times New Roman";
        font-variant:small-caps;}
p.Ttulo1sinnumero, li.Ttulo1sinnumero, div.Ttulo1sinnumero
        {
        margin-top:18.0pt;
        margin-right:0cm;
        margin-bottom:6.0pt;
        margin-left:0cm;
        text-align:center;
        line-height:110%;
        layout-grid-mode:char;
        font-size:16.0pt;
        font-family:"Times New Roman";
        text-transform:uppercase;
        font-weight:bold;}
p.Encabezado1, li.Encabezado1, div.Encabezado1
        {
        margin-top:8.0pt;
        margin-right:-1.45pt;
        margin-bottom:0cm;
        margin-left:0cm;
        margin-bottom:.0001pt;
        text-align:center;
        line-height:110%;
        layout-grid-mode:char;
        font-size:8.0pt;
        font-family:"Times New Roman";
        font-style:italic;}
p.Figure-fig, li.Figure-fig, div.Figure-fig
        {
        margin-top:12.0pt;
        margin-right:0cm;
        margin-bottom:6.0pt;
        margin-left:0cm;
        text-align:center;
        line-height:110%;
        page-break-after:avoid;
        layout-grid-mode:char;
        background:white;
        font-size:12.0pt;
        font-family:"Times New Roman";}
p.Publication, li.Publication, div.Publication
        {
        margin-top:6.0pt;
        margin-right:0cm;
        margin-bottom:0cm;
        margin-left:0cm;
        margin-bottom:.0001pt;
        text-align:justify;
        punctuation-wrap:simple;
        text-autospace:none;
        font-size:12.0pt;
        font-family:"CG Times";}
ol
        {margin-bottom:0cm;}
ul
        {margin-bottom:0cm;}
-->
</STYLE>
</HEAD><BODY link="blue" vlink="purple">

<DIV class="Section1">

<DIV style="border-top:solid windowtext .5pt;border-left:none;border-bottom:
solid windowtext .5pt;border-right:none;padding:1.0pt 0cm 1.0pt 0cm">

<P class="Publication" style="border:none;padding:0cm;"><A href="http://www.cic.ipn.mx/~sidorov"><SPAN style="text-decoration:none;">Grigori Sidorov</SPAN></A>, <A href="http://www.gelbukh.com/"><SPAN style="text-decoration:none;">Alexander Gelbukh</SPAN></A>. <I>La resoluci&oacute;n de correferencia con un diccionario de
escenarios</I>. Proc.
CIC-99, Simposium Internacional de Computaci&oacute;n, November 15 - 19, 1999, CIC, IPN,
Mexico D.F., pp.&nbsp;382-391.</P>

</DIV>

<P class="Publication">&nbsp;</P>

<P class="Ttulo1sinnumero">LA Resoluci&oacute;n de
correferencia<BR>
con un diccionario de escenarios</P>

<P class="MsoNormal" align="center" style="margin-top:12.0pt;margin-right:2.55pt;
margin-bottom:3.0pt;margin-left:0cm;text-align:center;"><I><SPAN style="font-size:14.0pt;">Grigori Sidorov </SPAN></I><SPAN style="font-size:
14.0pt;">y<I> Alexander Gelbukh</I></SPAN></P>

<P class="Ttulo1sinnumero" style="line-height:12.0pt;"><SPAN style="font-size:12.0pt;text-transform:
none;font-weight:normal">Laboratorio de Lenguaje
Natural,<BR>
Centro de Investigaci&oacute;n en Computaci&oacute;n,<BR>
Instituto Polit&eacute;cnico Nacional,<BR>
Av. Juan de Dios Batiz s/n, esq. Mendizabal, Zacatenco,<BR>
07738 M&eacute;xico D.F, M&eacute;xico.<BR>
</SPAN><SPAN style="font-size:12.0pt;
text-transform:none;font-weight:normal">{sidorov,
gelbukh}@pollux.cic.ipn.mx</SPAN><SPAN style="font-size:12.0pt;font-weight:normal"><BR><BR></SPAN></P>

<P class="MsoNormal" style="margin-top:8.0pt;margin-right:2.55pt;margin-bottom:
12.0pt;margin-left:0cm"><SPAN style="font-family:&quot;TIMES NEW ROMAN CYR&quot;">&nbsp;</SPAN></P>

</DIV>

<B><SPAN style="font-size:14.0pt;font-family:&quot;Times New Roman&quot;;"><BR clear="all" style="page-break-before:auto;">
</SPAN></B>

<DIV class="Section2">

<P class="Ttulo2sinnumero" style="margin-top:0cm">Abstract</P>

<P class="MsoNormal" style="margin-right:2.55pt"><SPAN style="font-family:&quot;TIMES NEW ROMAN CYR&quot;">The paper discusses an algorithm of
indirect anaphora resolution based on the use of a dictionary of prototypic
scenarios associated with each headword and a thesaurus of the standard type.
An example of anaphora of the type being considered is &ldquo;<I>I bough a house. The kitchen is extra large</I>.&rdquo; The structure of the
prototypic scenarios dictionary is discussed: in the simplest case, the
dictionary lists with each headword all the words denoting the typical or
possible participants of the situation described by the headword, e.g.: <I>religion</I> &mdash; <I>church</I>, <I>candle</I>, <I>priest</I>, <I>pray</I>, <I>Bible</I>, etc. The
algorithm looks for the intersection of the scenarios of the possible anaphor
and antecedent or for inclusion of one of them into the scenario of the other.
Also discussed is the combination of indirect anaphora with such complications
as metaphor, hyponimic relations, derivation, subordinate clauses, etc. We
argue that the method can be used to detect the very fact of the presence of
the anaphoric relation and thus serve to determine the actual articulation of
the phrase and the coherence of the text.</SPAN></P>

<P class="MsoNormal" style="margin-top:8.0pt;margin-right:2.55pt;margin-bottom:
12.0pt;margin-left:0cm"><SPAN style="font-family:&quot;TIMES NEW ROMAN CYR&quot;">Keywords:
<I>Indirect anaphora</I>, <I>semantic analysis</I>, <I>ambiguity resolution</I>, <I>dictionary</I>,
<I>natural language processing</I></SPAN><SPAN style="font-family:&quot;TIMES NEW ROMAN CYR&quot;;">.</SPAN></P>

<H2>1.<SPAN style="font:7.0pt &quot;Times New Roman&quot;">&nbsp;&nbsp;&nbsp;&nbsp;
</SPAN>Introducci&oacute;n</H2>

<P class="MsoNormal">La
resoluci&oacute;n de correferencia es una de las tareas m&aacute;s importantes en el
procesamiento del lenguaje natural (NLP). Es necesaria en una amplia gama de
tareas de NLP, de la comprensi&oacute;n del lenguaje a la estad&iacute;stica, la traducci&oacute;n,
y elaboraci&oacute;n de res&uacute;menes (Aone y McKee 1993; Carretero 1987; Cornish 1996;
Zorro 1987; Fretheim y Gundel 1996; Hahn, Strube, y Markert 1996; Hirst 1981;
Kameyama 1997; Mitkov 1997). A veces las relaciones de correferencia se llaman
anaf&oacute;ricas.</P>

<P class="MsoNormal" style="text-indent:21.2pt;line-height:12.0pt">Hay dos casos principales de
relaciones de correferencia:</P>

<P class="MsoNormal" style="text-indent:21.2pt;line-height:12.0pt">&nbsp;</P>

<P class="MsoNormal" style="text-indent:21.2pt;line-height:12.0pt">(1) la correferencia directa, como
en el discurso &ldquo;<I>he visto una nueva casa
ayer. <U>Su</U> cocina era excepcionalmente grande</I>&rdquo; (su<I> </I>= de <I>la casa</I>) y</P>

<P class="MsoNormal" style="text-indent:21.2pt;line-height:12.0pt">(2) la correferencia llamada
indirecta, como en el discurso &ldquo;<I>he visto
una nueva casa ayer. <U>La</U> cocina era excepcionalmente grande</I>&rdquo; (<I>la cocina </I>= de la <I>casa</I>), ejemplo de (Chafe 1974).</P>

<P class="MsoNormal" style="text-indent:21.2pt;line-height:12.0pt">&nbsp;</P>

<P class="MsoNormal" style="text-indent:0cm;line-height:12.0pt">En el &uacute;ltimo caso, la relaci&oacute;n de correferencia
se sostiene conceptualmente entre las dos palabras diferentes, <I>cocina </I>y <I>casa</I>; n&oacute;tese que no hay ninguna correferencia expl&iacute;cita entre estas
dos palabras. Como mostramos, la correferencia se sostiene entre la palabra <I>cocina </I>en el texto y la palabra <I>cocina </I>que est&aacute; introducida
impl&iacute;citamente en el discurso por la palabra <I>casa.</I> Enfocamos principalmente a resoluci&oacute;n de correferencia
indirecta que es el caso m&aacute;s dif&iacute;cil, aunque aparece en textos con menos
frecuencia.</P>

<P class="Reference" style="text-indent:21.2pt">La resoluci&oacute;n de correferencia indirecta y a&uacute;n
el descubrimiento de la presencia de correferencia indirecta es especialmente
dif&iacute;cil (Erku y Gundel 1987; Gundel, Hedberg, y Zacharski 1988; Indirect
Anaphora 1996; Sanford <I>et al.</I> 1983).
El marcador m&aacute;s frecuente de correferencia indirecta es la categor&iacute;a de
determinaci&oacute;n, expresada en espa&ntilde;ol por los sustantivos con art&iacute;culos
determinados, tambi&eacute;n v&eacute;ase (Ward y Birner 1994). En el caso de correferencia
directa se usan casi siempre pronombres personales, as&iacute; que para los ejemplos
como (1) por lo menos la presencia de correferencia es obvia. En los ejemplos
como (2), sin embargo, el art&iacute;culo determinado no s&oacute;lo puede usarse en la
funci&oacute;n anaf&oacute;rica, sino en las otras posibles funciones que son d&eacute;ixis,
contraposici&oacute;n, etc. (ver m&aacute;s adelante).</P>

<P class="MsoNormal" style="text-indent:21.2pt;line-height:12.0pt">Adicionalmente, el art&iacute;culo
determinado no es la &uacute;nica manera de expresi&oacute;n de correferencia indirecta. Un
tipo particular de marcadores de la correferencia indirecta se encuentra en las
expresiones con pronombres demostrativos, como en el ejemplo &ldquo;V<I>end&iacute; una casa. &iquest;Qu&eacute; puedo hacer con <U>este</U></I>
<I>dinero?</I>.&rdquo; Este ejemplo es a&uacute;n m&aacute;s
complicado ya que el pronombre demostrativo puede tener m&aacute;s sentidos que el
art&iacute;culo determinado.</P>

<P class="MsoNormal" style="text-indent:21.2pt;line-height:12.0pt">As&iacute;, dos problemas surgen con
respecto a la correferencia indirecta: (a) descubrir la presencia de la
correferencia indirecta, y (b) resolver la ambig&uuml;edad de la relaci&oacute;n de
correferencia. Sin embargo, nos acercaremos al problema en el orden opuesto:
nosotros intentaremos resolver la relaci&oacute;n de correferencia, y si nosotros
tenemos &eacute;xito, consideraremos que el elemento de esta relaci&oacute;n se descubre en
el discurso. Nuestro trabajo discute una manera de resoluci&oacute;n manejada mediante
un diccionario de correferencia indirecta.</P>

<P class="MsoNormal" style="text-indent:21.2pt;line-height:12.0pt">La estructura del trabajo es
siguiente. Primero, nosotros consideraremos algunos ejemplos &uacute;tiles. Despu&eacute;s
formularemos condiciones necesarias por haber existido una relaci&oacute;n de
correferencia indirecta basados en un diccionario de escenarios. Finalmente, nosotros
discutiremos un algoritmo que use estas condiciones para descubrir esa relaci&oacute;n
en el texto.<B></B></P>

<H2>2.<SPAN style="font:7.0pt &quot;Times New Roman&quot;">&nbsp;&nbsp;&nbsp;&nbsp;
</SPAN>Algunos ejemplos de correferencia
indirecta</H2>

<P class="MsoNormal" style="text-indent:21.2pt;line-height:12.0pt">Perm&iacute;tanos considerar los ejemplos
siguientes de correferencia indirecta. Para la discusi&oacute;n extensa necesitamos
tambi&eacute;n la informaci&oacute;n sobre la posibilidad o imposibilidad de ocurrencia de
pronombres demostrativos en varios contextos. Las variantes inaceptables se
marcan con un asterisco.</P>

<P class="MsoNormal" style="text-indent:21.2pt;line-height:12.0pt">&nbsp;</P>

<P class="MsoNormal" style="margin-left:18.0pt;text-indent:-18.0pt;line-height:
12.0pt;">1.<SPAN style="font:7.0pt &quot;Times New Roman&quot;">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
</SPAN><I>Compr&eacute; una casa. <U>La/*Esta</U> cocina </I>(<I>paredes,
techo</I>) <I>era sumamente grande.</I></P>

<P class="MsoNormal" style="margin-left:18.0pt;text-indent:-18.0pt;line-height:
12.0pt;">2.<SPAN style="font:7.0pt &quot;Times New Roman&quot;">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
</SPAN><I>Compr&eacute; una casa. <U>Las/*Estas</U> dimensiones
eran </I>20x20.</P>

<P class="MsoNormal" style="margin-left:18.0pt;text-indent:-18.0pt;line-height:
12.0pt;">3.<SPAN style="font:7.0pt &quot;Times New Roman&quot;">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
</SPAN><I>Compr&eacute; una casa. <U>El/*Este</U> due&ntilde;o anterior
estaba contento.</I></P>

<P class="MsoNormal" style="margin-left:18.0pt;text-indent:-18.0pt;line-height:
12.0pt;">4.<SPAN style="font:7.0pt &quot;Times New Roman&quot;">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
</SPAN><I>Estaba comprando una casa. Contaba <U>el/*este</U>
dinero cuidadosamente.</I></P>

<P class="MsoNormal" style="margin-left:18.0pt;text-indent:-18.0pt;line-height:
12.0pt;">5.<SPAN style="font:7.0pt &quot;Times New Roman&quot;">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
</SPAN><I>Vend&iacute; una casa. &iquest;Qu&eacute; puedo hacer yo con <U>el/este</U>
dinero?</I></P>

<P class="MsoNormal" style="margin-left:18.0pt;text-indent:-18.0pt;line-height:
12.0pt;">6.<SPAN style="font:7.0pt &quot;Times New Roman&quot;">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
</SPAN><I>Compr&eacute; una casa. Me gust&oacute; <U>el/este</U>
precio.</I></P>

<P class="MsoNormal" style="margin-left:18.0pt;text-indent:-18.0pt;line-height:
12.0pt;">7.<SPAN style="font:7.0pt &quot;Times New Roman&quot;">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
</SPAN><I>Juan estaba comiendo. <U>La/* Esta</U> mesa
estaba sucia.</I></P>

<P class="MsoNormal" style="margin-left:18.0pt;text-indent:-18.0pt;line-height:
12.0pt;">8.<SPAN style="font:7.0pt &quot;Times New Roman&quot;">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
</SPAN><I>Juan estaba comiendo. Estaba oscuro en <U>el/*este</U>
bosque.</I></P>

<P class="MsoNormal" style="margin-left:18.0pt;text-indent:-18.0pt;line-height:
12.0pt;">9.<SPAN style="font:7.0pt &quot;Times New Roman&quot;">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
</SPAN><I>Juan estaba comiendo. <U>La/Esta</U> comida
estaba deliciosa.</I></P>

<P class="MsoNormal" style="margin-left:18.0pt;text-indent:-18.0pt;line-height:
12.0pt;">10.<SPAN style="font:7.0pt &quot;Times New Roman&quot;">&nbsp;
</SPAN><I>Juan estaba comiendo. <U>Las/Estas</U> manzanas
estaban deliciosas.</I></P>

<P class="MsoNormal" style="margin-left:18.0pt;text-indent:-18.0pt;line-height:
12.0pt;">11.<SPAN style="font:7.0pt &quot;Times New Roman&quot;">&nbsp;
</SPAN><I>Juan estaba cantando. <U>El/Este</U> ruido
perturb&oacute; a Pedro.</I></P>

<P class="MsoNormal" style="margin-left:18.0pt;text-indent:-18.0pt;line-height:
12.0pt;">12.<SPAN style="font:7.0pt &quot;Times New Roman&quot;">&nbsp;
</SPAN><I>Juan estaba cantando. Pedro detest&oacute; e<U>l/este</U>
ruido.</I></P>

<P class="MsoNormal" style="margin-left:18.0pt;text-indent:-18.0pt;line-height:
12.0pt;">13.<SPAN style="font:7.0pt &quot;Times New Roman&quot;">&nbsp;
</SPAN><I>Juan estaba leyendo. Le gust&oacute; <U>el/este</U>
autor.</I></P>

<P class="MsoNormal" style="margin-left:18.0pt;text-indent:-18.0pt;line-height:
12.0pt;">14.<SPAN style="font:7.0pt &quot;Times New Roman&quot;">&nbsp;
</SPAN><I>Juan se muri&oacute;. <U>La/*Esta </U>viuda estaba
loca de dolor.</I></P>

<P class="MsoNormal" style="text-indent:21.2pt;line-height:12.0pt">&nbsp;</P>

<P class="MsoNormal" style="text-indent:21.2pt;line-height:12.0pt">En el ejemplo 1 la relaci&oacute;n de la
correferencia indirecta se sostiene entre la <I>cocina </I>y <I>casa:</I> <I><U>la</U> </I>cocina es la cocina de esa
casa. En cada uno de estas frases, nosotros consideramos una relaci&oacute;n como
puramente anaf&oacute;rica del art&iacute;culo determinado o del pronombre; por lo menos
estos ejemplos pueden tener este sentido. Las variantes marcadas con un
asterisco no son posibles en la interpretaci&oacute;n de correferencia.</P>

<P class="MsoNormal" style="text-indent:21.2pt;line-height:12.0pt">Sin embargo, en algunos casos el
art&iacute;culo determinado o el pronombre demostrativo no tienen ninguna relaci&oacute;n
anaf&oacute;rica como la de los ejemplos anteriores y entonces no son posibles en esta
interpretaci&oacute;n :</P>

<P class="MsoNormal" style="text-indent:21.2pt;line-height:12.0pt">&nbsp;</P>

<P class="MsoNormal" style="margin-left:18.0pt;text-indent:-18.0pt;line-height:
12.0pt;">15.<SPAN style="font:7.0pt &quot;Times New Roman&quot;">&nbsp;
</SPAN><I>*Compr&oacute; una casa. <U>Las</U><U>/Estas</U></I><I> flores son bonitas.</I></P>

<P class="MsoNormal" style="margin-left:18.0pt;text-indent:-18.0pt;line-height:
12.0pt;">16.<SPAN style="font:7.0pt &quot;Times New Roman&quot;">&nbsp;
</SPAN><I>*Juan estaba comiendo. Era oscuro en <U>el/este</U>
teatro.</I></P>

<P class="MsoNormal" style="margin-left:18.0pt;text-indent:-18.0pt;line-height:
12.0pt;">17.<SPAN style="font:7.0pt &quot;Times New Roman&quot;">&nbsp;
</SPAN><I>*Juan asisti&oacute; a una ceremonia religiosa. <U>El</U>
mulla y <U>el</U> rabino predicaron un serm&oacute;n<A href="http://www.gelbukh.com/CV/Publications/1999/CIC-1999-Anaphora.htm#_ftn1" name="_ftnref1" title="">.</A></I></P>

<P class="MsoNormal" style="text-indent:21.2pt;line-height:12.0pt">&nbsp;</P>

<P class="MsoNormal" style="text-indent:21.2pt;line-height:12.0pt">Por otro lado, estos ejemplos son
m&aacute;s o menos aceptables si no hay ninguna relaci&oacute;n anaf&oacute;rica entre las <I>flores </I>y <I>casa</I>, <I>teatro </I>y <I>comer.</I> En estos casos, las dos frases no
pueden tener ninguna relaci&oacute;n directa y la segunda frase puede referirse a un
contexto m&aacute;s amplio, o su art&iacute;culo determinado o pronombre pueden tener una
funci&oacute;n d&eacute;ictica: el portavoz simplemente puede apuntar con el dedo a <I>las flores </I>o puede estar en <I>el teatro.</I></P>

<P class="MsoNormal" style="text-indent:21.2pt;line-height:12.0pt">Particularmente interesante es el
caso de los pronombres demostrativos. Aunque la mayor&iacute;a de los ejemplos
anteriores no permite el uso de pronombres en la interpretaci&oacute;n anaf&oacute;rica,
ellos parecen absolutamente razonables en otras interpretaciones:</P>

<P class="MsoNormal" style="text-indent:21.2pt;line-height:12.0pt">&nbsp;</P>

<P class="MsoNormal" style="margin-left:18.0pt;text-indent:-18.0pt;line-height:
12.0pt;">18.<SPAN style="font:7.0pt &quot;Times New Roman&quot;">&nbsp;
</SPAN><I>Compr&eacute; una casa. <U>Esta</U> cocina </I>(<I>paredes,
techo</I>) <I>era sumamente grande.</I></P>

<P class="MsoNormal" style="margin-left:18.0pt;text-indent:-18.0pt;line-height:
12.0pt;">19.<SPAN style="font:7.0pt &quot;Times New Roman&quot;">&nbsp;
</SPAN><I>Estaba comprando una casa. Contaba <U>este </U>dinero
cuidadosamente.</I></P>

<P class="MsoNormal" style="text-indent:21.2pt;line-height:12.0pt">&nbsp;</P>

<P class="MsoNormal" style="text-indent:21.2pt;line-height:12.0pt">Una de las posibles interpretaciones
no-anaf&oacute;ricas de tales ejemplos es la contraposici&oacute;n: &ldquo;<I>esta cocina </I>es grande mientras las otras cocinas no lo son;&rdquo; en
este caso una tensi&oacute;n de entonaci&oacute;n especial se usa y no se refleja en el texto
escrito. Otra posible interpretaci&oacute;n no-anaf&oacute;rica es de nuevo la funci&oacute;n
d&eacute;ictica: el portavoz est&aacute; f&iacute;sicamente en <I>esta
cocina </I>o est&aacute; mostr&aacute;ndole <I>este dinero
</I>al oyente.</P>

<P class="MsoNormal" style="text-indent:21.2pt;line-height:12.0pt">Otro ejemplo que no permite la
relaci&oacute;n anaf&oacute;rica es:</P>

<P class="MsoNormal" style="text-indent:21.2pt;line-height:12.0pt">&nbsp;</P>

<P class="MsoNormal" style="margin-left:18.0pt;text-indent:-18.0pt;line-height:
12.0pt;">20.<SPAN style="font:7.0pt &quot;Times New Roman&quot;">&nbsp;
</SPAN>*<I>Pedro detesta que Juan estuviera comiendo
aqu&iacute;. <U>La</U></I><I><U>/</U></I><I><U>esta</U></I><I> mesa estaba sucia.</I></P>

<P class="MsoNormal" style="text-indent:21.2pt;line-height:12.0pt">&nbsp;</P>

<P class="MsoNormal" style="text-indent:21.2pt;line-height:12.0pt">Una pregunta surge: &iquest;C&oacute;mo distinguir
los casos de la posible relaci&oacute;n de correferencia expresada por el art&iacute;culo
determinado o por el pronombre demostrativo en el discurso? &iquest;En qu&eacute; casos
semejantes la relaci&oacute;n es posible? En las pr&oacute;ximas secciones, nosotros
discutimos algunas condiciones necesarias para esta relaci&oacute;n.</P>

<H2>3.<SPAN style="font:7.0pt &quot;Times New Roman&quot;">&nbsp;&nbsp;&nbsp;&nbsp;
</SPAN>Correferencia indirecta como una
referencia a un elemento del escenario</H2>

<P class="MsoNormal" style="text-indent:21.2pt;line-height:12.0pt">La correferencia indirecta puede
pensarse como correferencia entre una palabra y una entidad que est&aacute;
introducida impl&iacute;citamente en el texto anterior. Llamamos a tales entidades
impl&iacute;citas de una palabra, un <I>escenario
protot&iacute;pico </I>de esta palabra. As&iacute;, la relaci&oacute;n de correferencia aqu&iacute; es
entre una palabra y un elemento del escenario protot&iacute;pico de otra palabra en el
texto; el elemento correspondiente no tiene la representaci&oacute;n superficial en el
texto. La idea de escenarios expl&iacute;citos fue desarrollada, por ejemplo, en
(Shank, Lebowitz, y Birnbaum 1980).</P>

<P class="MsoNormal" style="text-indent:21.2pt;line-height:12.0pt">Hay tres posibles tipos de
correferencia indirecta que dependen de las relaciones entre el antecedente y
el anafor: (1) el anafor es una palabra en el texto mientras que el antecedente
es un elemento de un escenario de otra palabra; &eacute;ste es el caso m&aacute;s com&uacute;n, y
(2) viceversa, un concepto impl&iacute;cito hace referencia a una palabra en el texto
(un caso bastante raro), (3) la referencia se hace entre los conceptos
impl&iacute;citos (un caso a&uacute;n m&aacute;s raro). Perm&iacute;tanos considerar los ejemplos
siguientes:</P>

<P class="MsoNormal" style="text-indent:21.2pt;line-height:12.0pt">&nbsp;</P>

<P class="MsoNormal" style="margin-left:18.0pt;text-indent:-18.0pt;line-height:
12.0pt;">21.<SPAN style="font:7.0pt &quot;Times New Roman&quot;">&nbsp;
</SPAN><I>Juan estaba comiendo. La mesa estaba sucia.</I></P>

<P class="MsoNormal" style="margin-left:18.0pt;text-indent:-18.0pt;line-height:
12.0pt;">22.<SPAN style="font:7.0pt &quot;Times New Roman&quot;">&nbsp;
</SPAN><I>Juan se muri&oacute;. La viuda estaba loca de dolor.</I></P>

<P class="MsoNormal" style="margin-left:18.0pt;text-indent:-18.0pt;line-height:
12.0pt;"><I>23.<SPAN style="font:7.0pt &quot;Times New Roman&quot;">&nbsp; </SPAN></I><I>Juan fue enterrado. La viuda estaba loca de dolor.</I></P>

<P class="MsoNormal" style="margin-left:18.0pt;text-indent:-18.0pt;line-height:
12.0pt;">&nbsp;</P>

<P class="MsoNormal" style="text-indent:21.2pt;line-height:12.0pt">Aqu&iacute; los art&iacute;culos determinados se
usan con la <I>mesa </I>y la <I>viuda.</I> Sin embargo, estas palabras (y
los conceptos correspondientes) no aparecen literalmente en el discurso
anterior. &iquest;Cu&aacute;l es la raz&oacute;n para su determinaci&oacute;n? Puede explicarse por la
existencia de la relaci&oacute;n de correferencia indirecta: <I>comer&nbsp;&ndash; mesa</I>, <I>morir &ndash;
viuda</I>, <I>enterrar &ndash; viuda.</I> El
antecedente para <I>comer </I>contiene en su
escenario protot&iacute;pico una ranura para un <I>lugar
</I>con un posible valor<I> </I>de <I>mesa </I>en el primer ejemplo. En el segundo
ejemplo el verbo <I>morirse </I>se incluye
en el significado l&eacute;xico de la palabra <I>viuda.</I>
En el tercer ejemplo, el concepto <I>morirse
</I>es com&uacute;n con los significados l&eacute;xicos de <I>viuda </I>y <I>enterrar.</I></P>

<P class="MsoNormal" style="text-indent:21.2pt;line-height:12.0pt">As&iacute;, nosotros podemos formular la
versi&oacute;n preliminar siguiente de una condici&oacute;n necesaria para la posibilidad de
correferencia indirecta:</P>

<P class="MsoNormal" style="text-indent:21.2pt;line-height:12.0pt">&nbsp;</P>

<P class="MsoNormal" style="text-indent:0cm;line-height:12.0pt"><B><I>Condici&oacute;n 1</I></B><I> (preliminar).</I>
La correferencia indirecta s&oacute;lo es posible si cualquiera de las siguientes
condiciones se sostiene:</P>

<P class="MsoList" style="margin-left:18.0pt;text-indent:-18.0pt;line-height:
12.0pt;"><SPAN style="font-family:Symbol;">&middot;<SPAN style="font:7.0pt &quot;Times New Roman&quot;">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
</SPAN></SPAN>El
anafor pertenece al escenario del antecedente, o</P>

<P class="MsoList" style="margin-left:18.0pt;text-indent:-18.0pt;line-height:
12.0pt;"><SPAN style="font-family:Symbol;">&middot;<SPAN style="font:7.0pt &quot;Times New Roman&quot;">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
</SPAN></SPAN>El
antecedente pertenece al escenario del anafor, o </P>

<P class="MsoList" style="margin-left:18.0pt;text-indent:-18.0pt;line-height:
12.0pt;"><SPAN style="font-family:Symbol;">&middot;<SPAN style="font:7.0pt &quot;Times New Roman&quot;">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
</SPAN></SPAN>Sus
escenarios se intersectan.</P>

<P class="MsoNormal" style="text-indent:21.2pt;line-height:12.0pt">&nbsp;</P>

<P class="MsoNormal" style="text-indent:21.2pt;line-height:12.0pt">Las tres partes de la Condici&oacute;n 1 corresponden
con los tres tipos de la correferencia indirecta y no son iguales. As&iacute; que la
decisi&oacute;n que se tom&oacute; en base de la primera parte de Condici&oacute;n&nbsp;1 tiene m&aacute;s
probabilidad que una basada en la segunda. La tercera parte de Condici&oacute;n&nbsp;1
es un caso a&uacute;n m&aacute;s raro y el menos probable. As&iacute;, en el algoritmo cuantitativo
ellas tienen probabilidades diferentes.</P>

<P class="MsoNormal" style="text-indent:21.2pt;line-height:12.0pt">Perm&iacute;tanos notar que la
correferencia indirecta puede combinar con algunos fen&oacute;menos que involucran
substituci&oacute;n de una palabra por otra, como el uso de sin&oacute;nimos, los t&eacute;rminos
m&aacute;s generales o m&aacute;s espec&iacute;ficos (vea ejemplos 12 y 10, correspondientemente),
met&aacute;fora (ejemplo 13), o cambiando la parte de la oraci&oacute;n superficial en el
discurso (derivaci&oacute;n). Tales fen&oacute;menos son transparentes para la correferencia
indirecta, aunque disminuye la adecuaci&oacute;n de correferencia indirecta en el
texto y as&iacute; disminuye la fiabilidad del resultado de su descubrimiento.
Probablemente, sea mayor distancia entre las nociones correspondientes, menor
naturalmente sea la expresi&oacute;n de correferencia indirecta.</P>

<P class="MsoNormal" style="text-indent:21.2pt;line-height:12.0pt">Llamaremos a las palabras que pueden
sustituirse por un anafor o antecedente <I>compatible
</I>con &eacute;l. Ellos son equivalentes a la palabra b&aacute;sica de nuestros algoritmos.
Para una palabra compatible es posible usar, por ejemplo, un sin&oacute;nimo, un
t&eacute;rmino m&aacute;s espec&iacute;fico o m&aacute;s generalizado, o una met&aacute;fora de la palabra b&aacute;sica,
aunque no cualquiera de &eacute;stos, dependiendo de un contexto espec&iacute;fico. Las
reglas para determinar compatibilidad est&aacute;n m&aacute;s all&aacute; del alcance de este
art&iacute;culo. Por ejemplo, la relaci&oacute;n de compatibilidad no es sim&eacute;trica: una
met&aacute;fora apenas puede aparecer como un elemento del escenario, mientras su
apariencia como un elemento de relaci&oacute;n anaf&oacute;rica de superficie es posible.
An&aacute;logamente, un t&eacute;rmino m&aacute;s generalizado apenas puede usarse como un anafor de
la superficie mientras el antecedente oculto es su t&eacute;rmino m&aacute;s espec&iacute;fico.
Probablemente, las razones para esto est&aacute;n en el mecanismo de la correferencia
indirecta cuando la presencia del concepto potencialmente introducido y su representaci&oacute;n
de superficie (y, as&iacute;, el tipo de la situaci&oacute;n) deben clarificarse en el
contexto expl&iacute;cito, vea ejemplos 8, 10; en el ejemplo 24:</P>

<P class="MsoNormal" style="text-indent:21.2pt;line-height:12.0pt">&nbsp;</P>

<P class="MsoNormal" style="margin-left:18.0pt;text-indent:-18.0pt;line-height:
12.0pt;">24.<SPAN style="font:7.0pt &quot;Times New Roman&quot;">&nbsp;
</SPAN><I>Juan asisti&oacute; a una ceremonia religiosa. Los
mullas predicaron un serm&oacute;n.</I></P>

<P class="MsoNormal" style="text-indent:21.2pt;line-height:12.0pt">&nbsp;</P>

<P class="MsoNormal" style="text-indent:0cm;line-height:12.0pt">s&oacute;lo la segunda frase clarifica que la
ceremonia era musulmana. Estos hechos necesitan investigaci&oacute;n extensa. Aqu&iacute;,
damos &eacute;nfasis a que ellos tomar&aacute;n en cuenta al aplicar las condiciones de la
correferencia indirecta formuladas a continuaci&oacute;n entre la compatibilidad del
anafor y el antecedente.</P>

<P class="MsoNormal" style="text-indent:21.2pt;line-height:12.0pt">Ahora nosotros podemos formular una
versi&oacute;n mejorada de Condici&oacute;n 1:</P>

<P class="MsoNormal" style="text-indent:21.2pt;line-height:12.0pt">&nbsp;</P>

<P class="MsoNormal" style="text-indent:0cm;line-height:12.0pt"><B><I>Condici&oacute;n 1</I></B><I>.</I> La
correferencia indirecta s&oacute;lo es posible si cualquiera de las condiciones se
sostienen:</P>

<P class="MsoList" style="margin-left:18.0pt;text-indent:-18.0pt;line-height:
12.0pt;"><SPAN style="font-family:Symbol;">&middot;<SPAN style="font:7.0pt &quot;Times New Roman&quot;">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
</SPAN></SPAN>El
anafor es compatible con un elemento del escenario del antecedente, o</P>

<P class="MsoList" style="margin-left:18.0pt;text-indent:-18.0pt;line-height:
12.0pt;"><SPAN style="font-family:Symbol;">&middot;<SPAN style="font:7.0pt &quot;Times New Roman&quot;">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
</SPAN></SPAN>El
antecedente es compatible con un elemento del escenario del anafor, o </P>

<P class="MsoList" style="margin-left:18.0pt;text-indent:-18.0pt;line-height:
12.0pt;"><SPAN style="font-family:Symbol;">&middot;<SPAN style="font:7.0pt &quot;Times New Roman&quot;">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
</SPAN></SPAN>Sus
escenarios intersectan (en el significado de compatibilidad).</P>

<H2>4.<SPAN style="font:7.0pt &quot;Times New Roman&quot;">&nbsp;&nbsp;&nbsp;&nbsp;
</SPAN>Condiciones sint&aacute;cticas</H2>

<P class="MsoNormal" style="text-indent:21.2pt;line-height:12.0pt">En este art&iacute;culo, nosotros
consideramos s&oacute;lo relaciones de correferencia entre las palabras en frases
diferentes (o partes diferentes de una frase compuesta). Una discusi&oacute;n
interesante de la posibilidad de las relaciones anaf&oacute;ricas dentro de una frase
simple ser&aacute; el tema de nuestro trabajo futuro. Aqu&iacute; nosotros discutimos s&oacute;lo
una complicaci&oacute;n m&aacute;s relacionada a las frases incluidas.</P>

<P class="MsoNormal" style="text-indent:21.2pt;line-height:12.0pt">Como el ejemplo 20 muestra, la
Condici&oacute;n 1 no es la &uacute;nica condici&oacute;n necesaria para la posibilidad de la
relaci&oacute;n anaf&oacute;rica. Nuestro an&aacute;lisis extenso se relacion&oacute; con los problemas
inducidos por este ejemplo. A primera vista, la condici&oacute;n siguiente es
adecuada:</P>

<P class="MsoNormal" style="text-indent:21.2pt;line-height:12.0pt">&nbsp;</P>

<P class="MsoNormal" style="text-indent:0cm;line-height:12.0pt"><B><I>Condici&oacute;n 2</I></B><I> (preliminar).</I>
La correferencia indirecta s&oacute;lo es posible para el nivel sem&aacute;ntico m&aacute;s alto de
la situaci&oacute;n.</P>

<P class="MsoNormal" style="text-indent:21.2pt;line-height:12.0pt">&nbsp;</P>

<P class="MsoNormal" style="line-height:12.0pt">En el ejemplo 20, el nivel m&aacute;s alto de la
situaci&oacute;n es &ldquo;<I>Pedro detest&oacute;</I>&rdquo; y la
correferencia indirecta a la situaci&oacute;n subordinada no es posible. El nivel
sem&aacute;ntico m&aacute;s alto corresponde obviamente sint&aacute;cticamente a la parte principal
de la frase compleja. Sin embargo, esta condici&oacute;n no es verdadera para el
ejemplo siguiente:</P>

<P class="MsoNormal" style="text-indent:21.2pt;line-height:12.0pt">&nbsp;</P>

<P class="MsoNormal" style="margin-left:18.0pt;text-indent:-18.0pt;line-height:
12.0pt;">25.<SPAN style="font:7.0pt &quot;Times New Roman&quot;">&nbsp;
</SPAN><I>Juan se desanim&oacute; al encontrar que su autom&oacute;vil
no funcionaba. <U>La</U><U>/*E</U></I><I><U>sta </U></I><I>bater&iacute;a estaba muerta.</I></P>

<P class="MsoNormal" style="text-indent:21.2pt;line-height:12.0pt">&nbsp;</P>

<P class="MsoNormal" style="text-indent:21.2pt;line-height:12.0pt">Puesto que ambos ejemplos, 20 y 25,
consisten de dos frases, la diferencia entre ellos no puede depender de las
relaciones de la primera y la segunda partes. Nosotros creemos que la
diferencia est&aacute; en el nivel de coherencia entre las dos frases. En el ejemplo
25, las dos frases son coherentes: una nueva frase puede construirse
relacion&aacute;ndolas&nbsp; con una conjunci&oacute;n subordinada
<I>porque.</I> En el ejemplo 20, ninguna
conjunci&oacute;n subordinada es aplicable. As&iacute; que nosotros podamos introducir una
noci&oacute;n de <I>conexi&oacute;n sint&aacute;ctica </I>en el
sentido descrito anteriormente. Si dos frases pueden conectarse por una
conjunci&oacute;n subordinada, entonces ellas est&aacute;n <I>sint&aacute;cticamente conectadas.</I> Esta noci&oacute;n obviamente tiene una
naturaleza discursiva y se relaciona a la coherencia del texto (Downing y
Noonan 1995; Fraurud 1992, 1996; Partee y Sgall 1996; Tomlin 1987). Perm&iacute;tanos
considerar m&aacute;s ejemplos para esta noci&oacute;n:</P>

<P class="MsoNormal" style="text-indent:21.2pt;line-height:12.0pt">&nbsp;</P>

<P class="MsoNormal" style="margin-left:18.0pt;text-indent:-18.0pt;line-height:
12.0pt;">26.<SPAN style="font:7.0pt &quot;Times New Roman&quot;">&nbsp;
</SPAN><I>Juan detest&oacute; que yo comprara una casa. <U>La</U>
cocina </I>(<I>paredes, techo</I>) <I>era sumamente grande.</I></P>

<P class="MsoNormal" style="margin-left:18.0pt;text-indent:-18.0pt;line-height:
12.0pt;">27.<SPAN style="font:7.0pt &quot;Times New Roman&quot;">&nbsp;
</SPAN><I>Juan detest&oacute; que yo comprara una casa. <U>El</U>
due&ntilde;o anterior estaba contento.</I></P>

<P class="MsoNormal" style="margin-left:18.0pt;text-indent:-18.0pt;line-height:
12.0pt;">28.<SPAN style="font:7.0pt &quot;Times New Roman&quot;">&nbsp;
</SPAN><I>*Juan estaba satisfecho de que yo comprara una
casa. Yo detest&eacute; <U>el</U> precio.</I></P>

<P class="MsoNormal" style="margin-left:18.0pt;text-indent:-18.0pt;line-height:
12.0pt;">29.<SPAN style="font:7.0pt &quot;Times New Roman&quot;">&nbsp;
</SPAN><I>*Detest&eacute; que Juan estuviera comiendo all&iacute;. <U>La</U>
comida estaba deliciosa.</I></P>

<P class="MsoNormal" style="margin-left:18.0pt;text-indent:-18.0pt;line-height:
12.0pt;">30.<SPAN style="font:7.0pt &quot;Times New Roman&quot;">&nbsp;
</SPAN><I>*Estaba desanimado de que Juan estaba leyendo
all&iacute;. Le gust&oacute; <U>el</U> autor.</I></P>

<P class="MsoNormal" style="margin-left:18.0pt;text-indent:-18.0pt;line-height:
12.0pt;">31.<SPAN style="font:7.0pt &quot;Times New Roman&quot;">&nbsp;
</SPAN><I>*Yo estaba muy frastornado por la muerte de
Juan. <U>La</U> viuda estaba loca de dolor.</I></P>

<P class="MsoNormal" style="text-indent:21.2pt;line-height:12.0pt">&nbsp;</P>

<P class="MsoNormal" style="text-indent:21.2pt;line-height:12.0pt">Los ejemplos 26 y 27 s&oacute;lo son
aceptables si nosotros asumimos que hay una relaci&oacute;n causal entre las primeras
y las segundas frases, es decir, si a Juan no le gustan las cocinas grandes
(ejemplo 26) y por una raz&oacute;n desconocida odia al due&ntilde;o anterior (ejemplo 27).
Si no hay ninguna relaci&oacute;n, entonces los ejemplos son inaceptables. As&iacute;, nosotros
podemos modificar la Condici&oacute;n 2:</P>

<P class="MsoNormal" style="text-indent:21.2pt;line-height:12.0pt"><B>&nbsp;</B></P>

<P class="MsoNormal" style="text-indent:0cm;line-height:12.0pt"><B><I>Condici&oacute;n 2</I></B><I>.</I> Si no se
conectan las partes que contienen el anafor y el antecedente sint&aacute;cticamente,
entonces la correferencia indirecta s&oacute;lo es posible para el nivel sem&aacute;ntico m&aacute;s
alto de la situaci&oacute;n.</P>

<P class="MsoNormal" style="text-indent:21.2pt;line-height:12.0pt">&nbsp;</P>

<P class="MsoNormal" style="text-indent:21.2pt;line-height:12.0pt">Desgraciadamente, hasta ahora no
tenemos ning&uacute;n algoritmo que descubra la conexi&oacute;n sint&aacute;ctica. Entretanto, la
Condici&oacute;n 2 podr&iacute;a justificarse por una evaluaci&oacute;n estad&iacute;stica: &iquest;que es lo m&aacute;s
frecuente en los textos, la presencia o ausencia del conexi&oacute;n sint&aacute;ctica? Esto requiere
investigaciones extensas, aunque nuestra evaluaci&oacute;n muestra que las relaciones
subordinadas normalmente tienen una representaci&oacute;n de superficie. Ahora usamos
la Condici&oacute;n 2 en nuestro algoritmo, aunque los casos donde la Condici&oacute;n 2 se
aplicar&iacute;a son bastante raros en los textos reales.</P>

<P class="MsoNormal" style="text-indent:21.2pt;line-height:12.0pt">Enfatizamos que las Condiciones 1 y
2 muestran s&oacute;lo la posibilidad de la correferencia indirecta pero no su
presencia obligatoria, siendo as&iacute; condiciones necesarias pero no suficientes.</P>

<H2>5.<SPAN style="font:7.0pt &quot;Times New Roman&quot;">&nbsp;&nbsp;&nbsp;&nbsp;
</SPAN>El algoritmo y el diccionario</H2>

<P class="MsoNormal" style="text-indent:21.2pt;line-height:12.0pt">El algoritmo para detectar la
correferencia trabaja como sigue. Considera cada palabra. Si una palabra se
introduce con un art&iacute;culo determinado o un pronombre demostrativo, entonces es
un anafor potencial, y el algoritmo intenta encontrar un antecedente cre&iacute;ble
para &eacute;l. Busca los posibles candidatos para antecedentes bas&aacute;ndose en la
distancia lineal y en la estructura del anafor potencial. En el caso m&aacute;s
simple, es suficiente probar las palabras precedentes a la izquierda, cuyos
pesos bajan conforme la distancia crece; el algoritmo se detiene cuando un
antecedente se encuentra o las probabilidades son demasiado bajas. Como hemos
mencionado, el algoritmo actual no prueba las palabras dentro de la misma frase
simple.</P>

<P class="MsoNormal" style="text-indent:21.2pt;line-height:12.0pt">Para cada antecedente potencial, se
prueban las condiciones descritas antes. Como hemos discutido, en algunos casos
(por ejemplo, midiendo compatibilidad) el grado de satisfacci&oacute;n de la condici&oacute;n
puede determinarse como una probabilidad, en lugar de una respuesta s&iacute;-no. En ese caso, se combinan las probabilidades para las condiciones y
la distancia (multiplican), y un umbral se usa para decidir cual par de las
palabras pasa la prueba. Si el candidato satisface todas las condiciones aplicables,
la relaci&oacute;n anaf&oacute;rica se encuentra.</P>

<P class="MsoNormal" style="text-indent:21.2pt;line-height:12.0pt">Para verificar la posibilidad de una
relaci&oacute;n de correferencia indirecta entre dos palabras, se usa un diccionario
que lista los miembros del escenario protot&iacute;pico para cada palabra. En nuestro
caso, nosotros usamos un diccionario compilado de varias fuentes, como el
diccionario de Clasitex (Guzm&aacute;n Arenas 1998), FACT&Oacute;TUM que es el diccionario de
SemNet derivado del tesauro de Roget, y algunos otros diccionarios.</P>

<P class="MsoNormal" style="text-indent:21.2pt;line-height:12.0pt">Nuestro diccionario de escenarios
protot&iacute;picos tiene la estructura sugerida en (Guzm&aacute;n Arenas 1998), y se
discuti&oacute; con mayor detalle en (Gelbukh, Sidorov, y Guzm&aacute;n Arenas 1999). En ese
diccionario cada palabra se relaciona a las palabras que pueden significar los
participantes potenciales de la situaci&oacute;n expresadas por la palabra de la
entrada para el caso m&aacute;s simple. No se especifican los tipos de relaciones
entre las palabras lo que significa que la relaci&oacute;n no deber&iacute;a ser una de las
relaciones estandard predeterminadas (parte, actuante, etc.). Este tipo de
conocimiento no se usa en el algoritmo. Por ejemplo, la entrada del diccionario
para la palabra <I>iglesia </I>incluye las
palabras relacionadas a &eacute;sta en uno en los diccionarios expresados arriba: <I>sacerdote, vela, icono, oraci&oacute;n, </I>etc.</P>

<P class="MsoNormal" style="text-indent:21.2pt;line-height:12.0pt">Para verificar a compatibilidad de
palabras (sinonimia, generalizaci&oacute;n, especificaci&oacute;n, met&aacute;fora) usamos un
tesauro compilado en base al diccionario FACT&Oacute;TUM de SemNet, WordNet, y algunas
otras fuentes.</P>

<H2>6.<SPAN style="font:7.0pt &quot;Times New Roman&quot;">&nbsp;&nbsp;&nbsp;&nbsp;
</SPAN>Conclusiones y trabajo futuro</H2>

<P class="MsoNormal" style="text-indent:21.2pt;line-height:12.0pt">Nosotros hemos discutido un
algoritmo basado en un diccionario de filtraci&oacute;n de posibles candidatos para
los antecedentes de la correferencia indirecta expresados con un art&iacute;culo
determinado o, como un caso especial, con un pronombre demostrativo. A saber,
el algoritmo verifica las dos condiciones: (1) la intersecci&oacute;n entre los
escenarios, (2) la posibilidad sint&aacute;ctica de la relaci&oacute;n. En la pr&aacute;ctica,
sugerimos usar este algoritmo m&aacute;s bien para el descubrimiento de la misma
presencia de la correferencia indirecta, y no s&oacute;lo para el descubrimiento del
antecedente cuando la presencia de la relaci&oacute;n anaf&oacute;rica se conoce.</P>

<P class="MsoNormal" style="text-indent:21.2pt;line-height:12.0pt">Planeamos extender el presente
trabajo de informaci&oacute;n en el diccionario. Primero, el diccionario debe incluir
un tipo de &ldquo;los pesos&rdquo; de los elementos del escenario. Los elementos
obligatorios tienen el peso m&aacute;s alto; sin embargo, los &ldquo;optativo&rdquo; pueden relacionarse
m&aacute;s estrechamente la palabra encabezado o pueden estar m&aacute;s bien lejos de ella.
Por ejemplo, la palabra <I>mesa </I>en el
ejemplo 7 no es obligatoria, pero es un participante muy probable de la
situaci&oacute;n de <I>comer.</I> Por otro lado, la
palabra <I>bosque </I>en el ejemplo 8 es un
posible, pero no probable participante de esta situaci&oacute;n. En el ejemplo 16, la
palabra <I>teatro </I>parece ser imposible
como un lugar de <I>comer.</I> Pueden
obtenerse tales pesos de algunos diccionarios sem&aacute;nticos como el n&uacute;mero de
relaciones entre las palabras, y tambi&eacute;n de un corpus grande.</P>

<P class="MsoNormal" style="text-indent:21.2pt;line-height:12.0pt">La segunda extensi&oacute;n al diccionario
es la especificaci&oacute;n de las alternativas. La fuente m&aacute;s importante de
alternativas es el grupo de palabras que ocupan el mismo ranura en el
escenario, o el mismo rol sem&aacute;ntico, como <I>asunto,
lugar</I>, etc. En el ejemplo 17, el escenario para la <I>ceremonia religiosa </I>incluir&iacute;a como posibles participantes <I>mulla </I>y <I>rabino</I>, y la presencia de cualquiera de ellos es obligatoria, sin
embargo, ellos no pueden aparecer, los dos, en el escenario protot&iacute;pico. As&iacute;,
el escenario debe especificar un rol<I> </I>que
liste un <I>curo</I>,<I> padre</I>, <I>papa</I>, <I>mulla</I>, y <I>rabino.</I> El rol es marcado como obligatorio, pero la noci&oacute;n<I> ceremonia religiosa </I>puede ser el
antecedente para s&oacute;lo una palabra de esta lista. Semejantemente, el escenario
de <I>lugar </I>para el verbo <I>comer </I>incluir&iacute;a <I>mesa, bosque</I>, etc. As&iacute;, planeamos agrupar las palabras en los
escenarios seg&uacute;n su exclusividad mutua en la situaci&oacute;n.</P>

<P class="Ttulo2sinnumero">Agradecimiento</P>

<P class="MsoNormal">Este
trabajo fue realizado con soporte parcial de CONACyT, SNI, CGEPI-IPN y REDII-CONACyT.</P>

<P class="Ttulo2sinnumero">Referencias</P>

<P class="Reference">Aone, Ch., and D. McKee. 1993.
Language-independent anaphora resolution system for understanding multilingual
texts. Proceedings of the 31st meeting of the ACL. The Ohio State University,
Columbus, Ohio.</P>

<P class="MsoNormal" style="margin-left:13.5pt;text-indent:-13.5pt">Ariel, M. 1988. Referring and accessibility. Journal of Linguistics,
<B>24</B>: 67-87.</P>

<P class="MsoNormal" style="margin-left:13.5pt;text-indent:-13.5pt">Bosch, P. 1988. Representing and accessing focussed referents.
Language and Cognitive Processes, <B>3</B>:
207-231.</P>

<P class="Reference">Carter, D. 1987. Interpreting anaphora in
natural language texts. Ellis Horwood, Chichester.</P>

<P class="MsoNormal" style="margin-left:13.5pt;text-indent:-13.5pt">Cornish, F. 1996. &lsquo;Antecedentless&rsquo; anaphors: deixis, anaphora, or
what? Some evidence from English and French. Journal of Linguistics<I>,</I> 32: 19-41.</P>

<P class="Reference">Cowan, R. 1995. What are Discource
Principles Made of? In P. Downing and M. Noonan (Eds.), Word Order in
discource. Benjamins, Amsterdam/Philadelfia.</P>

<P class="Reference">Chafe, W. 1976. Giveness, Contrastiveness,
Definiteness, Subject, Topics, and Point of View. In Ch.&nbsp;N. Li (Ed.),
Subject and Topic. Academic Press, New York. pp. 27-55.</P>

<P class="Reference">Chafe, W. 1987. Cognitive Constraints in
Information Flow. In R. Tomlin&nbsp; (Ed.),
Coherence and Grounding in Discourse. Benjamins, Amsterdam. pp. 21-51.</P>

<P class="Reference">Chafe, W. 1994. Discourse, Consciousness,
and Time. The University of Chicago Press, Chicago &ndash; London. 327 pp.</P>

<P class="Reference">Downing, P., and M. Noonan (Eds.). 1995.
Word Order in discourse. Benjamins, Amsterdam/Philadelfia. 595 pp.</P>

<P class="MsoNormal" style="margin-left:13.5pt;text-indent:-13.5pt">Erku, F., and J. K. Gundel. 1987. The pragmatics of indirect
anaphors. In J. Verschueren and M. Bertuccelli-Papi (Eds.), The pragmatic
perspective: Selected papers from the 1985 International Pragmatics Conference.
John Benjamins, Amsterdam. pp. 533-545.</P>

<P class="MsoNormal" style="margin-left:13.5pt;text-indent:-13.5pt">Fox, B. A. 1987. Discourse structure and anaphora: written and
conversational English. Cambridge University Press, Cambridge.</P>

<P class="MsoNormal" style="margin-left:13.5pt;text-indent:-13.5pt">Fraurud, K. 1992. Processing noun phrases in natural discourse.
Doctoral dissertation, Stockholm University, Stockholm.</P>

<P class="MsoNormal" style="margin-left:13.5pt;text-indent:-13.5pt">Fraurud, K. 1996. Cognitive ontology and NP form. In T. Fretheim and
J. K. Gundel (Eds.), Reference and referent accessibility (pp. 193-212). John
Benjamins, Amsterdam.</P>

<P class="MsoNormal" style="margin-left:13.5pt;text-indent:-13.5pt">Fretheim, T., and J. K. Gundel (Eds.). 1996. Reference and referent
accessibility. John Benjamins, Amsterdam.</P>

<P class="MsoNormal" style="margin-left:14.2pt;text-indent:-14.2pt">Gelbukh, A. F., G. Sidorov, and A. Guzm&aacute;n-Arenas. 1999. Use
of a Weighted Topic Hierarchy for Document Classification. Proceedings of the
International Conference: Text, Solution, Dialogue (TSD&rsquo;99). Prague. (to
appear)</P>

<P class="Reference">Gundel, J., N. Hedberg, and R. Zacharski.
1988. Giveness, Implicature and Demonstrative Expressions in English Discource.
Proceedings of 25th meeting of Chicago Linguistic Society, Part II (Parasession
on Language in Context). Chicago. pp. 89-103.</P>

<P class="MsoNormal" style="margin-left:14.2pt;text-indent:-14.2pt">Guzm&aacute;n-Arenas, A. 1998. Finding the main themes in a Spanish document. Journal Expert
Systems with Applications, 14 (1, 2): 139-148.</P>

<P class="MsoNormal" style="margin-left:13.5pt;text-indent:-13.5pt">Hahn, U., M. Strube, and K. Markert. 1996. Bridging textual ellipses.
Proceedings of the 16th International Conference on Computational Linguistics.
pp. 496-501.</P>

<P class="MsoNormal" style="margin-left:13.5pt;text-indent:-13.5pt">Hellman, C. 1996. The &lsquo;price tag&rsquo; on knowledge activation in
discourse processing. In T. Fretheim and J. K. Gundel (Eds.), Reference and
referent accessibility. John Benjamins, Amsterdam.</P>

<P class="Reference">Hirst, G. 1981. Anaphora in Natural
Language Understanding. Springer Verlag, Berlin.</P>

<P class="Reference">Indirect Anaphora Workshop. 1996. Lancaster
University, Lancaster.</P>

<P class="Reference">Kameyama, M. 1997. Recognizing Referential
Links: an Information Extraction Perspective. Proceedings of ACL&rsquo;97/EACL&rsquo;97
workshop on Operational factors in practical, robust anaphora resolution.
Madrid.</P>

<P class="Reference">Lambrecht, K. 1994. Information Structure
and Sentence Form. Topic, Focus and the Mental Representation of Discource
Referents. Cambridge University Press, Cambridge. 388 pp.</P>

<P class="Reference">Mel&rsquo;&#269;uk, I. A. 1988. Dependency Synax:
Theory and Practice. The State University of New York Press, Albany, New York.
428 pp. </P>

<P class="Reference">Mel&rsquo;&#269;uk, I. A. 1999. Communicative
Organization in Natural Language: The Semantic-Communicative Structure of
Sentence. 380 pp. (to appear)</P>

<P class="Reference">Mitkov, R. 1997. Factors in Anaphora
Resolution: They are not the Only Things that Matter. A Case Study Based on Two
Different Approaches. Proc. of the ACL&rsquo;97/EACL&rsquo;97 workshop on Operational factors
in practical, robust anaphora resolution. Madrid.</P>

<P class="Reference">Partee, B., and P. Sgall (Eds.). 1996.
Discource and Meaning. Papers in Honour of Eva Haji&#269;ova. Benjamins, Amsterdam/Philadelphia.</P>

<P class="MsoNormal" style="margin-left:13.5pt;text-indent:-13.5pt">Sanford, A. J., S. C. Garrod, A. Lucas, and R. Henderson. 1983.
Pronouns without explicit antecedents? Journal of Semantics, <B>2</B>: 303-318.</P>

<P class="MsoNormal" style="margin-left:13.5pt;text-indent:-13.5pt">Shank, R. C., M. Lebowitz, and L. Birnbaum. 1980. An Integrated
Understander. American Journal of Computational Linguistics, <B>6 </B>(l): 13-30.</P>

<P class="Reference">Tomlin, R. (Ed.). 1987. Coherence and
Grounding in Discource. Benjamins, Amsterdam. 512 pp.</P>

<P class="MsoNormal" style="margin-left:13.5pt;text-indent:-13.5pt">Ward, G., and B. Birner. 1994. Definiteness and the English
existential. Language, <B>71</B>: 722-742.</P>

<P class="MsoNormal" style="margin-left:13.5pt;text-indent:-13.5pt">Yule, G. 1982. Interpreting anaphora without identifying reference.
Journal of Semantics, <B>1</B>: 315-322.</P>

</DIV>

<SPAN style="font-size:12.0pt;font-family:
&quot;Times New Roman&quot;;"><BR clear="all" style="page-break-before:auto;">
</SPAN>

<DIV class="Section3">

<P class="MsoNormal" style="margin-left:13.5pt;text-indent:-13.5pt">&nbsp;</P>

</DIV>

<DIV><BR clear="all">

<HR align="left" size="1" width="33&percnt;">

<DIV id="ftn1">

<P class="MsoFootnoteText"><A href="http://www.gelbukh.com/CV/Publications/1999/CIC-1999-Anaphora.htm#_ftnref1" name="_ftn1" title=""></A>&nbsp;</P>

</DIV>

</DIV>




</BODY></HTML>